L6 ANSWER 3 OF 19 CAPLUS COPYRIGHT 2002 ACS 



ACCESSION NUMBER: 
DOCUMENT NUMBER: 
TITLE: 



INVENTOR (S) : 

PATENT ASSIGNEE (S) : 
SOURCE: 

DOCUMENT TYPE: 
LANGUAGE : 

FAMILY ACC. NUM. COUNT: 
PATENT INFORMATION: 



2001: 654747 CAPLUS 
135:222364 

DNA sequence of human prostaglandin E2 receptor 1 ( 
EPl-R) gene, and methods for the 
diagnosis of polymorphisms thereof 

Smith, John Craig; Anand, Rakesh; Morten, John Edward 
Norris 

Astrazeneca AB, Swed. 



Eur. Pat. Appl. 

CODEN: EPXXDW 

Patent 

English 

1 



20 pp. 



PATENT NO. 



KIND DATE 



APPLICATION NO. DATE 



EP 
EP 



US 
JP 



1130122 
1130122 
R: AT, BE, 
IE, SI, 
2002076702 
2001286288 



A2 20010905 
A3 20011017 
CH, DE, DK, ES, 
LT, LV, FI, RO 
Al 20020620 
A2 20011016 



PRIORITY APPLN. INFO. 



EP 2001-301291 20010213 

FR, GB, GR, IT, LI, LU, NL, SE, MC, PT, 

US 2001-781311 20010213 
JP 2001-40076 20010216 
GB 2000-3553 A 20000217 

GB 2000-8376 A 20000406 

AB The invention provides the genomic DNA sequence of the human 
prostaglandin 

E2 receptor 1 (EPl-R) gene; it differs from the cDNA sequence of EMBL 
L22647 and the DNA sequence of EMBL AC008569. The invention also 
provides 

methods of diagnosing fourteen specific polymorphisms in the 
EPl-R gene and novel allelic polypeptides encoded 

thereby. The invention provides allele-specif ic probes and/or primers 



for 



use in diagnosis. The invention also relates to methods of diagnosis and 
treatment of EPl-R ligand mediated diseases, such as cancer or arthritis. 
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AB 



Institute, Tokyo, Japan . 

CANCER RESEARCH, (1999 Oct 15) 59 (20) 5093-6. 
Journal code: 2984705R. ISSN: 0008-5472. 
United States 

Journal; Article; (JOURNAL ARTICLE) 
English 

Priority Journals 
199911 

Entered STN: 20000111 
Last Updated on STN: 20000111 
Entered Medline: 19991110 
Although the cyclooxygenase pathway of the arachidonic acid cascade has 
been suggested to play an important role in colon carcinogenesis, the 
molecular species of prostanoids and receptors involved have not been 
fully elucidated yet. We examined the development of aberrant crypt foci 
(ACFs), putative preneoplastic lesions of the colon, in two lines of 
knockout mice, each deficient in prostaglandin E 
receptors^ EPl and EPS, by treatment with the colon 

carcinogen, azoxymethane . Formation of ACFs was decreased only in the 
EPl-knockout mice to approximately 60% of the level in wild-type mice. 
Administration of 250, 500, or 1000 ppm of a novel selective EPl 
antagonist, ONO-8711, in the diet to azoxymethane-treated C57BL/6J mice 
also resulted in a dose-dependent reduction of ACF formation. Moreover, 
when Min mice, having a nonsense mutation in the adenomatous polyposis 
coli gene, were given 500 ppm ONO-8711 in the diet, the number of 
intestinal polyps was significantly reduced to 57% of that in the basal 
diet group. These results strongly suggest that prostaglandin E2 
contributes to colon carcinogenesis to some extent through its action at 
the EPl receptor. Thus, EPl antagonists may be good candidates as 
chemopreventive agents for colon cancer. 
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Institute, Tokyo, Japan., tkawainor@gan2.ncc.go.jp 
ANTICTiJ^CER RESEARCH, (2001 Nov-Dec) 21 { 6A) 3865-9. 
Journal code: 8102988. ISSN: 0250-7005. 
Greece 

Journal; Article; (JOURNAL ARTICLE) 
English 

Priority Journals 
200204 

Entered STN: 20020326 
Last Updated on STN: 20020420 
Entered Medline: 20020419 
BACKGROUND: Cyclooxygenases (COXs) and prostanoids play pivotal roles in 
colon carcinogenesis. This study was designed to determine the 
chemopreventive effects of ONO-8711, a selective prostaglandin E receptor 
EPl antagonist, on the development of azoxymethane (AOM) -induced colonic 
aberrant crypt foci (ACF) in male F344 rats and to compare its potential 
with that of nimesulide, a well-documented selective COX-2 inhibitor. 
MATERIALS AND METHODS: Five-week-old male F344 rats received s.c. 
injections of AOM (15 mg/kg body weight) or the saline vehicle once 
weekly 

for two weeks and were fed the control diet (AIN-76A) or the experimental 
diets containing 400 or 800 ppm of ONO-8711 or 400 ppm nimesulide for 5 
weeks. RESULTS: Administration of ONO-8711 at 800 ppm significantly 
reduced the total number of ACF/ colon and 5-bromodeoxyuridine (BrdUrd) 
labeling index as compared to the control diet group (by 31% and 66%, 
respectively) . As expected, dietary administration of nimesulide also 
suppressed the development of ACF and BrdUrd labeling index in the colon, 
by about 39% and 54%, respectively. CONCLUSION: Our finding that ONO-8711 
significantly suppresses colonic ACF formation and cell proliferation 
strengthens the hypothesis that the selective prostaglandin E 
receptor EPl antagonists possesses chemopreventive 
activity against colon cancer development. 
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AC008569 227245 bp DNA linear PRI 05-SEP-2001 

Homo sapiens chromosome 19 clone CTC-54 8K16, complete sequence. 
AC008569 

AC008569.7 GI: 15431055 

HTG. 

human . 

Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 {bases 1 to 227245) 

DOE Joint Genome Institute and Stanford Human Genome Center. 

Direct Submission 

Unpublished 

2 {bases 1 to 227245) 

DOE Joint Genome Institute. 
Direct Submission 

Submitted ( 03-AUG-1999 ) Production Sequencing Facility, DOE Joint 
Genome Institute, 2800 Mitchell Drive, Walnut Creek, CA 94598, USA 

3 {bases 1 to 227245) 

DOE Joint Genome Institute and Stanford Human Genome Center. 
Direct Submission 

Submitted {08-NOV-2000) DOE Joint Genome Institute, 2800 Mitchell 
Drive, Walnut Creek, CA 94598, USA 

4 (bases 1 to 227245) 

DOE Joint Genome Institute and Stanford Human Genome Center. 
Direct Submission 

Submitted ( 05-SEP-2001 ) DOE Joint Genome Institute, 2800 Mitchell 
Drive, Walnut Creek, CA 94598, USA 

On Sep 5, 2001 this sequence version replaced gi: 11120757. 
Draft Sequence Produced by DOE Joint Genome Institute 
www. j gi . doe . gov 

Finishing Completed at Stanford Human Genome Center 
www-shgc. Stanford. edu 

Quality: Phrap Quality >=40 99.8% of Sequence; 

Estimated Total Number of Errors is 0.3. 

STS Content: 

SHGC-23895 G28498 

SHGC-141627 G63606 

SHGC-35463 G29823 

SHGC-31833 G29335. 

Location/Qualif iers 

1. .227245 

/organism="Homo sapiens" 
/db_xref-"taxon: 9606" 
/ chromosome="19" 
/clone="CTC-548K16" 
54928 a 59916 c 58482 g 53919 t 



Query Match 99.7%; Score 3904.8; DB 9; Length 227245; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 3906; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 



Qy 1 aaacagagtgtggtcaggggcagttttggcaataaggagtgtgtgtgcgtgtgtgtatct 60 



I I I I I I I I M M I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 211000 AAACAGAGTGTGGTCAGGGGCAGTTTTGGCAATAAGGAGTGTGTGTGCGTGTGTGTATCT 210941 

Qy 61 ctcggggtgccaagtgagaccctatttcccagcactaaggagggtggttcgggtgatcat 120 

I M M I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 210940 CTCGGGGTGCCAAGTGAGACCCTATTTCCCAGCACTAAGGAGGGTGGTTCGGGTGATCAT 210881 

Qy 121 ctcagagggctgcattttggggtgttgggaggggctggaattgaggcagtaactctgggt 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M M M M I I I I I I I I I I I I 
Db 210880 CTCAGAGGGCTGCATTTTGGGGTGTTGGGAGGGGCTGGAATTGAGGCAGTAACTCTGGGT 210821 

Qy 181 gcgtcccggcgctgggggtaagaccctgagttcagggatgtggcggcagcaacctggctg 240 

I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 210820 GCGTCCCGGCGCTGGGGGTAAGACCCTGAGTTCAGGGATGTGGCGGCAGCAACCTGGCTG 210761 

Qy 241 t get gaga tggggacaggatgaaactgagtggtaagtgacaggattgtatgtcttagggt 300 
I I M I M I M M M M M M I I I I I I I M I I I I I I I I I I I I I M M I I I I I I I I I I I I I I 

Db 2107 60 TGCTGAGATGGGGACAGGATGAAACTGAGTGGTAAGTGACAGGATTGTATGTCTTAGGGT 210701 

Qy 301 gtgaggctgtgccagtgtgaccctacttctcagggcaggaggcgagtctttgtgtcttag 360 

M M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 210700 GTGAGGCTGTGCCAGTGTGACCCTACTTCTCAGGGCAGGAGGCGAGTCTTTGTGTCTTAG 210641 

Qy 361 gacgtgtgtcacaggtgtcactcagcccatcttaaaggagccagtcactggggagagtcc 420 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21064 0 GACGTGTGTCACAGGTGTCACTCAGCCCATCTTAAAGGAGCCAGTCACTGGGGAGAGTCC 210581 

Qy 421 ccaggtcgccaggcctcctggttcccctgccccctttcagcctcctcccaggatatgact 480 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
Db 210580 CCAGGTCGCCAGGCCTCCTGGTTCCCCTGCCCCCTTTCAGCCTCCTCCCAGGATATGACT 210521 

Qy 481 cgctgtggccctagccggggcttaagcccctgtataaataggcggatcccctggccaggc 540 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I 
Db 210520 CGCTGTGGCCCTAGCCGGGGCTTAAGCCCCTGTATAAATAGGCGGATCCCCTGGCCAGGC 210461 

Qy 541 tgggcctgacccaagctggtctacccgaggccctgcccaccagcacccaccccgacatcc 600 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 2104 60 TGGGCCTGACCCAAGCTGGTCTACCCGAGGCCCTGCCCACCAGCACCCACCCCGACATCC 210401 

Qy 601 acgaaggctttggcagggcagggggggcattgctggccccacagaattggagttagcctc 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 210400 ACGAAGGCTTTGGCAGGGCAGGGGGGGCATTGCTGGCCCCACAGAATTGGAGTTAGCCTC 210341 

Qy 661 tctagctccaaagccccagggaggggggcagtggcaccccctgcagctgccccagcccgc 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 210340 TCTAGCTCCAAAGCCCCAGGGAGGGGGGCAGTGGCACCCCCTGCAGCTGCCCCAGCCCGC 210281 

Qy 721 cccagacgacgctcacattttccagtgtttagattttatccgctttattaatgaggcaag 780 

I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 210280 CCCAGACGACGCTCACATTTTCCAGTGTTTAGATTTTATCCGCTTTATTAATGAGGCAAG 210221 

Qy 781 aggcccgatcctgggggggaagggggctgctcccgccctgctgggaggagggggtcacat 840 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 210220 AGGCCCGATCCTGGGGGGGAAGGGGGCTGCTCCCGCCCTGCTGGGAGGAGGGGGTCACAT 210161 

Qy 841 ggggccagaccaactccagggagcctcactcctcgtggagggagccgctggggcccagag 900 
I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 210160 GGGGCCAGACCAACTCCAGGGAGCCTCACTCCTCGTGGAGGGAGCCGCTGGGGCCCAGAG 210101 

Qy 901 tggcccccgcccattgccaggagcagagaggggggtctctgccactccaggcccccagcg 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 210100 TGGCCCCCGCCCATTGCCAGGAGCAGAGAGGGGGGTCTCTGCCACTCCAGGCCCCCAGCG 210041 

Qy 961 ggcgtgcgcggggtggagcggcccctggaggccagcaagggcggcgggaggagctgagga 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 210040 GGCGTGCGCGGGGTGGAGCGGCCCCTGGAGGCCAGCAAGGGCGGCGGGAGGAGCTGAGGA 209981 

Qy 1021 gccgccccaggaagagggagggaggaagcggcttgccggagagccagggcgcagtgggcg 1080 

I I I I I I I I I I M I M M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I M I I I I 
Db 209980 GCCGCCCCAGGAAGAGGGAGGGAGGAAGCGGCTTGCCGGAGAGCCAGGGCGCAGTGGGCG 209921 

Qy 1081 gcagggctgagcggccggtgatggggaccccacatcccaggcagtgccgggtaagcgggt 1140 
I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 209920 GCAGGGCTGAGCGGCCGGTGATGGGGACCCCACATCCCAGGCAGTGCCGGGTAAGGGGGT 209861 

Qy 1141 tgcacatgagggtccctgattggggaggaggagggcatgaaggggtggggccatggccac 1200 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 209 860 TGCACATGAGGGTCCCTGATTGGGGAGGAGGAGGGCATGAAGGGGTGGGGCCATGGCCAC 209801 

Qy 1201 ctgctgtccgtcctgtgtccccgggctcttctccctgatctgtgcgtccctgtcttaccg 1260 

I I I I M I M I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 209800 CTGCTGTCCGTCCTGTGTCCCCGGGCTCTTCTCCCTGATCTGTGCGTCCCTGTCTTACCG 209741 

Qy 1261 tctgtccatcctcccttcccatctggcctggtgggcagttccgccctttcagccctcacc 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M M I I I I I I I I I I I I I I I I I 
Db 209740 TCTGTCCATCCTCCCTTCCCATCTGGCCTGGTGGGCAGTTCCGCCCTTTCAGCCCTCACC 209681 

Qy 1321 accaggatatcaaagagtggatggtcgtggggccgcctccaggcctctggggcagggata 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 209680 ACCAGGATATCAAAGAGTGGATGGTCGTGGGGCCGCCTCCAGGCCTCTGGGGCAGGGATA 209621 

Qy 1381 tggagtggaaccgtgggcacccagggtgaggcagaggtgatcggggtagggcctggcgag 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 209620 TGGAGTGGAACCGTGGGCACCCAGGGTGAGGCAGAGGTGATCGGGGTAGGGCCTGGCGAG 209561 

Qy 1441 agaccgcagtggagcaggggcaggtccatggggcaggggcagagatgggtccatggcaca 1500 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
Db 209560 AGACCGCAGTGGAGCAGAGGCAGGTCCATGGGGCAGGGGCAGAGATGGGTCCATGGCACA 209501 

Qy 1501 gatgtggctgtgccatgtggggtcagagatgggtccatgggggacagggacatggccgtg 1560 

I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 209500 GATGTGGCTGTGCCATGTGGGGTCAGAGATGGGTCCATGGGGGACAGGGACATGGCCGTG 209441 

Qy 1561 gggagagatgtgcccgtggtggtagagatggggctggggcatcgaggatgggactggagt 1620 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 20 944 0 GGGAGAGATGTGCCCGTGGTGGTAGAGATGGGGCTGGGGCATCGAGGATGGGACTGGAGT 209381 

Qy 1621 aaagctgacatggggaaagtcaggtagggccacagtggcagaaatgggtgagagctatca 1680 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 209380 AAAGCTGACATGGGGAAAGTCAGGTAGGGCCACAGTGGCAGAAATGGGTGAGAGCTATCA 209321 

Qy 1681 gatggagccacaggccccaggaatttgctgggtgtaaaaatggaaggtgggggtcggagg 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M M I I I M I I M I I I I I 
Db 209320 GATGGAGCCACAGGCCCCAGGAATTTGCTGGGTGTAAAAATGGAAGGTGGGGGTCGGAGG 209261 



Qy 1741 cactggcagagatgcctgagggcggggctggggggaatcttgcaggaaaccatgaagggc 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I 
Db 209260 CACTGGCAGAGATGCCTGAGGGCGGGGCTGGGGGGAATCTTGCAGGAAACCATGAAGGGC 209201 

Qy 1801 agagaaagggccagtggggttagagggaggccctggagcaggagatggggtggtgagagg 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 209200 AGAGAAAGGGCCAGTGGGGTTAGAGGGAGGCCCTGGAGCAGGAGATGGGGTGGTGAGAGG 209141 

Qy 1861 caaaagagagggagaagggtttccaaatggagtggccaggtcatttggagttgcccatgg 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 20914 0 CAAAAGAGAGGGAGAAGGGTTTCCAAATGGAGTGGCCAGGTCATTTGGAGTTGCCCATGG 209081 

Qy 1921 caactgccatgggcagaggggccgcctgagaacgccatggagtcaaacaggccctgatgt 1980 

M I I I I I M I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 209080 CAACTGCCATGGGCAGAGGGGCCGCCTGAGAACGCCATGGAGTCAAACAGGCCCTGATGT 209021 

Qy 1981 tctgagatggcaccgtgggctggtccccgcccgggcccagccagcctcactctgccctcc 2040 

I I I I I I I I I I I M M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 209020 TCTGAGATGGCACCGTGGGCTGGTCCCCGCCCGGGCCCAGCCAGCCTCACTCTGCCCTCC 208961 

Qy 2041 tctcctctatccagcacccctggcgcctgacatgagcccttgcgggcccctcaacctgag 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
Db 208960 TCTCCTCTATCCAGCACCCCTGGCGCCTGACATGAGCCCTTGCGGGCCCCTCAACCTGAG 208901 

Qy 2101 cctggcgggcgaggcgaccacatgcgcggcgccctgggtccccaacacgtcggccgtgcc 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 08 900 CCTGGCGGGCGAGGCGACCACATGCGCGGCGCCCTGGGTCCCCAACACGTCGGCCGTGCC 208841 

Qy 2161 gccgtcgggcgcttcgcccgcgctgcccatcttctccatgacgctgggcgccgtgtccaa 2220 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 2 08840 GCCGTCGGGCGCTTCGCCCGCGCTGCCCATCTTCTCCATGACGCTGGGCGCCGTGTCCAA 208781 

Qy 2221 cctgctggcgctggcgctgctggcgcaggccgcgggccgcctgcgacgccgccgctcggc 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 208780 CCTGCTGGCGCTGGCGCTGCTGGCGCAGGCCGCGGGCCGCCTGCGACGCCGCCGCTCGGC 208721 

Qy 2281 cgccaccttcctgctgttcgtggccagcctgctggccaccgacctggcgggccacgtgat 2340 

I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 208720 CGCCACCTTCCTGCTGTTCGTGGCCAGCCTGCTGGCCACCGACCTGGCGGGCCACGTGAT 208661 

Qy 2341 cccgggcgcgctggtgctgcgtctgtacactgcggggcgcgctccggccggcggggcctg 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 208 660 CCCGGGCGCGCTGGTGCTGCGTCTGTACACTGCGGGGCGCGCTCCGGCCGGCGGGGCCTG 2 08 601 

Qy 2401 ccacttcctgggcggctgcatggtcttcttcggcctgtgcccgctgctgctgggctgtgg 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 208600 CCACTTCCTGGGCGGCTGCATGGTCTTCTTCGGCCTGTGCCCGCTGCTGCTGGGCTGTGG 208541 

Qy 2461 catggccgtggagcgctgcgtgggcgtcacgcggccgctgctccacgccgcgcgggtctc 2520 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 20854 0 CATGGCCGTGGAGCGCTGCGTGGGCGTCACGCGGCCGCTGCTCCACGCCGCGCGGGTCTC 208481 

Qy 2521 ggtcgcccgcgcgcgcctggcgctggccgcggtggccgcggtggccttggccgtggcgct 2580 

I I I I I I M I I I M M I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I 
Db 208480 GGTCGCCCGCGCGCGCCTGGCGCTGGCCGCGGTGGCCGCGGTGGCCTTGGCCGTGGCGCT 208421 



Qy 2581 gctgccgctggcgcgcgtgggccgctatgagctgcagtacccgggcacgtggtgcttcat 2640 

I I I I I M M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 208420 GCTGCCGCTGGCGCGCGTGGGCCGCTATGAGCTGCAGTACCCGGGCACGTGGTGCTTCAT 208361 

Qy 2641 cggcctgggtcccccgggcggctggcgccaggcactgcttgctggcctcttcgccagcct 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
Db 208360 CGGCCTGGGTCCCCCGGGCGGCTGGCGCCAGGCACTGCTTGCTGGCCTCTTCGCCAGCCT 208301 

Qy 2701 cggcctggtcgcgctcctcgccgcgctggtgtgcaacacgctcagcggcctggccctgct 2760 

I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 208300 CGGCCTGGTCGCGCTCCTCGCCGCGCTGGTGTGCAACACGCTCAGCGGCCTGGCCCTGCT 208241 

Qy 2761 acgcgcccgctggcgacgccgctcccgacggcctcccccggcctcaggccccgacagccg 2820 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 0824 0 ACGCGCCCGCTGGCGACGCCGCTCCCGACGGCCTCCCCCGGCCTCAGGCCCCGACAGCCG 208181 

Qy 2821 gcgtcgctggggggcgcacggaccccgctcggcctccgcctcgtccgcctcgtccatcgc 28 80 

M I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 208180 GCGTCGCTGGGGGGCGCACGGACCCCGCTCGGCCTCCGCCTCGTCCGCCTCGTCCATCGC 208121 

Qy 2881 ttcggcctccaccttctttggcggctctcggagcagcggctcggcacgcagagctcgcgc 2940 

M M I I I I I I I I I I I I I I I I I I I M M I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I 
Db 208120 TTCGGCCTCCACCTTCTTTGGCGGCTCTCGGAGCAGCGGCTCGGCACGCAGAGCTCGCGC 208061 

Qy 2941 ccacgacgtggagatggtgggccagcttgtcggtatcatggtggtgtcgtgcatctgctg 3000 
I I I I I I I I I I I I M M M I I I I I I I I I I M M I I I I I I I I I I I I I I M M I I I I I I I I I I 

Db 208060 CCACGACGTGGAGATGGTGGGCCAGCTTGTCGGTATCATGGTGGTGTCGTGCATCTGCTG 208001 

Qy 3001 gagcccaatgctggtgaggggcgcaccggcccctcgagccacgctccttcccgctccctc 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M M I I I I I I I I I I I I I I I M 
Db 208000 GAGCCCAATGCTGGTGAGGGGCGCACCGGCCCCTCGAGCCACGCTCCTTCCCGCTCCCTC 207941 

Qy 3061 tcggcaccctcccgccctttgtcgtcccaggacacctggggcctccatcctggactcaac 3120 

I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 207940 TCGGCACCCTCCCGCCCTTTGTCGTCCCAGGACACCTGGGGCCTCCATCCTGGACTCAAC 207881 

Qy 3121 caaggccccggcccctagaggccccacctgccccgaaagccagcatcgccttctccatct 3180 

I I I I I I I I I I M M I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 207880 CAAGGCCCCGGCCCCTAGAGGCCCCACCTGCCCCGAAAGCCAGCATCGCCTTCTCCATCT 207 821 

Qy 3181 gacctcccatccttcctcctagcccccctctcctcttcctttttggggtctttgtagcgc 3240 
I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I 

Db 207820 GACCTCCCATCCTTCCTCCTAGCCCCCCTCTCCTCTTCCTTTTTGGGGTCTTTGTAGCGC 207761 

Qy 3241 accccgacccacacaagcctcctctcctgccccaccgttataagtcgccgcgcttcattc 3300 

I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 207760 ACCCCGACCCACACAAGCCTCCTCTCCTGCCCCACCGTTATAAGTCGCCGCGCTTCATTC 207701 

Qy 3301 cctagtcctttcacccaacccccttgcttttcctctttccgggacacctgagactcctct 3360 
M M I I I M I M I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 207700 CCTAGTCCTTTCACCCAACCCCCTTGCTTTTCCTCTTTCCGGGACACCTGAGACTCCTCT 207641 

Qy 3361 acggccggacccccacccactgaaggtgtttgtttctttgccccccttttttttccgcat 3420 

I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 207640 ACGGCCGGACCCCCACCCACTGAAGGTGTTTGTTTCTTTGCCCCCCTTTTTTTTCCGCAT 207581 

Qy 3421 ccgtttctcatctggatccccatttaccctccctgcgacggctcgcccctcctcccaggc 3480 



Db 207580 CCGTTTCTCATCTGGATCCCCATTTACCCTCCCTGCGACGGCTCGCCCCTCCTCCCAGGC 207521 

Qy 3481 ttttaccttccagccacgcccccaccatccctgcgcccccctgcgcccgcgcctgctcta 3540 

I I I I I I I I M M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M M M I I I I I I I I I I I I 
Db 207520 TTTTACCTTCCAGCCACGCCCCCACCATCCCTGCGCCCCCCTGCGCCCGCGCCTGCTCTA 207461 

Qy 3541 tagctcacaccggcttcccccgcaggtgttggtggcgctggccgtcggcggctggagctc 3600 

I I I M I I M I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I M M I I M I I I I I I I I I 
Db 2074 60 TAGCTCACACCGGCTTCCCCCGCAGGTGTTGGTGGCGCTGGCCGTCGGCGGCTGGAGCTC 207401 

Qy 3601 tacctccctgcagcggccactgttcctggccgtgcgccttgcctcctggaaccagatcct 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M 
Db 207400 TACCTCCCTGCAGCGGCCACTGTTCCTGGCCGTGCGCCTTGCCTCCTGGAACCAGATCCT 207341 

Qy 3661 ggacccttgggtgtacatcctactgcgccaggccgtgctgcgccaactgcttcgcctctt 3720 
M M M I I I I I I I I I I I M I M M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I 

Db 2 0734 0 GGACCCTTGGGTGTACATCCTACTGCGCCAGGCCGTGCTGCGCCAACTGCTTCGCCTCTT 2 07281 

Qy 3721 gcccccgagggccggagccaagggcggccccgcggggctgggcctaacaccgagcgcctg 3780 

I I M I M I M I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 207280 GCCCCCGAGGGCCGGAGCCTVAGGGCGGCCCCGCGGGGCTGGGCCTAACACCGAGCGCCTG 207221 

Qy 3781 ggaggccagctcgctgcgcagctcccggcacagcggcctcagccacttctaagcacaacc 3840 

I I I I I I I I I M I I I M M I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 207220 GGAGGCCAGCTCGCTGCGCAGCTCCCGGCACAGCGGCCTCAGCCACTTCTAAGCACAACC 207161 

Qy 3841 agaggcccaacgactaagccagcccaccctgggctgggcccaggtgcgcggcgcagagcc 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
Db 207160 AGAGGCCCAACGACTAAGCCAGCCCACCCTGGGCTGGGCCCAGGTGCGCGGCGCAGAGCC 207101 

Qy 3901 tttgggaa 3908 

I I I I I I I I 
Db 207100 TTTGGGAA 207093 



RESULT 4 
HUMG 

LOCUS HUMG 137 6 bp mRNA linear PRI 03-JAN-1994 

DEFINITION Human prostaglandin receptor epl subtype mRNA, complete cds . 
ACCESSION L22647 
VERSION L22647.1 GI; 410208 

KEYWORDS prostaglandin receptor epl subtype. 
SOURCE Homo sapiens cDNA to mRNA. 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo, 
REFERENCE 1 (bases 1 to 1376) 

AUTHORS Funk, CD., Furci,L., FitzGerald, G. A. , Grygorczyk, R. , Rochette,C., 

Bayne,M.A., Abramovitz,M. , Adam,M. and Metters,K.M. 
TITLE Cloning and expression of a cDNA for the human prostaglandin E 

4 receptor EPl subtype 
JOURNAL J. Biol. Chem. 268 (35), 26767-26772 (1993) 
MEDLINE 94075377 
REFERENCE 2 (bases 1 to 1376) 
AUTHORS Funk, CD. 
TITLE Direct Submission 

JOURNAL Submitted ( Ol-NOV-1993 ) Colin D. Funk, Department of Pharmacology, 
Vanderbilt University, Nashville, TN 37232, USA 
FEATURES Location/Qualifiers 
source 1. .1376 

/organism="Homo sapiens" 
/ db_x r e f = " t axon : 9 6 0 6 " 
/cell_line="HEL" 

/cell_type="erythroleukemia cell" 

/tissue_lib="lambda gtll of G.J. Roth" 
5'UTR 1. .74 

CDS 75. .1283 

/ codon_start=l 

/product="prostaglandin receptor epl subtype" 
/protein_id="AAC37539. 1" 
/db_xref="GI: 410209" 

/translation="MSPCGPLNLSLAGEATTCAAPWVPNTSAVPPSGASPALPIFSMT 
LGAVSNLLALALLAQAAGRLRRRRSATTFLLFVASLLATDLAGHVIPGALVLRLYTAG 
RAPAGGACHFLGGCMVFFGLCPLLLGCGMAVERCVGVTRPLLHAARVSVARARLALAA 
VAAVALAVALLPLARVGRYELQYPGTWCFIGLGPPGGWRQALLAGLFASLGLVALLAA 
LVCNTLSGLALHRARWRRRSRRPPPASGPDSRRRWGAHGPRSASASSASSIASASTFF 
GGSRSSGSARRARAHDVEMVGQLVGIMWSCICWSPMLVLVALAVGGWSSTSLQRPLF 
LAVRLASWNQILDPWVYILLRQAVLRQLLRLLPPRAGAKGGPAGLGLTPSAWEASSLR 
SSRHSGLSHF" 

3'UTR 1284. .1376 

polyA_signal 1358. .1363 
BASE COUNT 138 a 526 c 484 g 228 t 

ORIGIN 



Query Match 24.7%; Score 967; DB 9; Length 1376; 

Best Local Similarity 97.0%; Pred. No. 9.8e-101; 

Matches 985; Conservative 0; Mismatches 30; Indels 0; Gaps 0; 

Qy 2051 ccagcacccctggcgcctgacatgagcccttgcgggcccctcaacctgagcctggcgggc 2110 

II I II I I I II I I I I I I I I II I I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I II I II I 
Db 54 CCGGCACCCCTGGCGCCTGACATGAGCCCTTGCGGGCCCCTCAACCTGAGCCTGGCGGGC 113 



Qy 2111 gaggcgaccacatgcgcggcgccctgggtccccaacacgtcggccgtgccgccgtcgggc 2170 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I M 
Db 114 GAGGCGACCACATGCGCGGCGCCCTGGGTCCCCAACACGTCGGCCGTGCCGCCGTCGGGC 173 

Qy 2171 gcttcgcccgcgctgcccatcttctccatgacgctgggcgccgtgtccaacctgctggcg 2230 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I 
Db 174 GCTTCGCCCGCGCTGCCCATCTTCTCCATGACGCTGGGCGCCGTGTCCAACCTGCTGGCG 233 

Qy 2231 ctggcgctgctggcgcaggccgcgggccgcctgcgacgccgccgctcggccgccaccttc 2290 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I 
Db 234 CTGGCGCTGCTGGCGCAGGCCGCGGGCCGCCTGCGACGCCGCCGCTCGGCCACCACCTTC 293 

Qy 22 91 ctgctgttcgtggccagcctgctggccaccgacctggcgggccacgtgatcccgggcgcg 2350 
M I I M I M M M M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 294 CTGCTGTTCGTGGCCAGCCTGCTGGCCACCGACCTGGCGGGCCACGTGATCCCGGGCGCG 353 

Qy 2351 ctggtgctgcgtctgtacactgcggggcgcgctccggccggcggggcctgccacttcctg 2410 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I 
Db 354 CTGGTGCTGCGTCTGTACACTGCGGGGCGCGCTCCGGCCGGCGGGGCCTGCCACTTCCTG 413 

Qy 2411 ggcggctgcatggtcttcttcggcctgtgcccgctgctgctgggctgtggcatggccgtg 2470 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I f I I I I I I I M I 
Db 414 GGCGGCTGCATGGTCTTCTTCGGCCTGTGCCCGCTGCTGCTGGGCTGTGGCATGGCCGTG 473 

Qy 2471 gagcgctgcgtgggcgtcacgcggccgctgctccacgccgcgcgggtctcggtcgcccgc 2530 

I I I M I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 474 GAGCGCTGCGTGGGCGTCACGCGGCCGCTGCTCCACGCCGCGCGGGTCTCGGTCGCCCGC 533 

Qy 2531 gcgcgcctggcgctggccgcggtggccgcggtggccttggccgtggcgctgctgccgctg 2590 

I M I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 534 GCGCGCCTGGCGCTGGCCGCGGTGGCCGCGGTGGCCTTGGCCGTGGCGCTGCTGCCGCTG 593 

Qy 2591 gcgcgcgtgggccgctatgagctgcagtacccgggcacgtggtgcttcatcggcctgggt 2650 

M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 594 GCGCGCGTGGGCCGCTATGAGCTGCAGTACCCGGGCACGTGGTGCTTCATCGGCCTGGGT 653 

Qy 2651 cccccgggcggctggcgccaggcactgcttgctggcctcttcgccagcctcggcctggtc 2710 

M I I M M I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I 
Db 654 CCCCCGGGCGGCTGGCGCCAGGCACTGCTTGCTGGCCTCTTCGCCAGCCTCGGCCTGGTC 713 

Qy 2711 gcgctcctcgccgcgctggtgtgcaacacgctcagcggcctggccctgctacgcgcccgc 2770 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M 
Db 714 GCGCTCCTCGCCGCGCTGGTGTGCAACACGCTCAGCGGCCTGGCCCTGCATCGCGCCCGC 773 

Qy 2771 tggcgacgccgctcccgacggcctcccccggcctcaggccccgacagccggcgtcgctgg 2830 

I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 774 TGGCGACGCCGCTCCCGACGGCCTCCCCCGGCCTCAGGCCCCGACAGCCGGCGTCGCTGG 8 33 

Qy 2831 ggggcgcacggaccccgctcggcctccgcctcgtccgcctcgtccatcgcttcggcctcc 2890 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 834 GGGGCGCACGGACCCCGCTCGGCCTCCGCCTCGTCCGCCTCGTCCATCGCTTCGGCCTCC 893 

Qy 2891 accttctttggcggctctcggagcagcggctcggcacgcagagctcgcgcccacgacgtg 295 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I 
Db 894 ACCTTCTTTGGCGGCTCTCGGAGCAGCGGCTCGGCACGCAGAGCTCGCGCCCACGACGTG 95 A " 

O 



Qy 2951 gagatggtgggccagcttgtcggtatcatggtggtgtcgtgcatctgctggagcccaatg 3010 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I M M I I I I I I I 
Db 954 GAGATGGTGGGCCAGCTTGTCGGTATCATGGTGGTGTCGTGCATCTGCTGGAGCCCAATG 1013 

Qy 3011 ctggtgaggggcgcaccggcccctcgagccacgctccttcccgctccctctcggc 3065 

I I I I I I II I I I I I I I III I I I II I I I I II 

Db 1014 CTGGTGTTGGTGGCGCTGGCCGTCGGCGGCTGGAGCTCTACCTCCCTGCAGCGGC 1068 



RESULT 5 

AR086516 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 

BASE COUNT 
ORIGIN 



AR086516 
Sequence 
AR086516 
AR086516. 



1394 bp 
from patent US 5985597. 

GI:10013282 



DNA 



linear PAT 07-SEP-2 



Unknown . 

Unknown . 

Unclassified. 

1 (bases 1 to 1394) 

Ford-Hutchinson, A. , Funk, C. , Grygorczyk, R. 
DNA encoding prostaglandin receptor EPl 
Patent: US 5985597-A 3 16-NOV-1999; 

Location/ Qualifiers 

1. .1394 

/organism= "unknown" 
157 a 525 c 484 g 228 t 



and Metters,K. 



Query Match 24.7%; Score 967; DB 6; Length 1394; 

Best Local Similarity 97.0%; Pred. No. 9.7e-101; 

98 5; Conservative 0; Mismatches 30; Indels 0; Gaps 

ccagcacccctggcgcctgacatgagcccttgcgggcccctcaacctgagcctggcgggc 2110 
II I I M I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I II 
CCGGCACCCCTGGCGCCTGACATGAGCCCTTGCGGGCCCCTCAACCTGAGCCTGGCGGGC 113 

gaggcgaccacatgcgcggcgccctgggtccccaacacgtcggccgtgccgccgtcgggc 2170 
II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I M I I I I 
GAGGCGACCACATGCGCGGCGCCCTGGGTCCCCAACACGTCGGCCGTGCCGCCGTCGGGC 173 



II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II M II M I I I I II I I I I 
GCTTCGCCCGCGCTGCCCATCTTCTCCATGACGCTGGGCGCCGTGTCCAACCTGCTGGCG 233 



I I I I I I I I I I I I M M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M II I 
CTGGCGCTGCTGGCGCAGGCCGCGGGCCGCCTGCGACGCCGCCGCTCGGCCACCACCTTC 2 93 

ctgctgttcgtggccagcctgctggccaccgacctggcgggccacgtgatcccgggcgcg 2350 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II II M I I I I I II I I I I 
CTGCTGTTCGTGGCCAGCCTGCTGGCCACCGACCTGGCGGGCCACGTGATCCCGGGCGCG 353 

ctggtgctgcgtctgtacactgcggggcgcgctccggccggcggggcctgccacttcctg 2410 
I I I I I I I I M I I I I I I I I I I M I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I II I I I I 
CTGGTGCTGCGTCTGTACACTGCGGGGCGCGCTCCGGCCGGCGGGGCCTGCCACTTCCTG 413 



Matches 


Qy 


2051 


Db 


54 


Qy 


2111 


Db 


114 


Qy 


2171 


Db 


174 


Qy 


2231 


Db 


234 


Qy 


2291 


Db 


294 


Qy 


2351 


Db 


354 



Qy 2411 ggcggctgcatggtcttcttcggcctgtgcccgctgctgctgggctgtggcatggccgtg 2470 

I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
Db 414 GGCGGCTGCATGGTCTTCTTCGGCCTGTGCCCGCTGCTGCTGGGCTGTGGCATGGCCGTG 473 

Qy 2471 gagcgctgcgtgggcgtcacgcggccgctgctccacgccgcgcgggtctcggtcgcccgc 2530 

I I I I M I M I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 47 4 GAGCGCTGCGTGGGCGTCACGCGGCCGCTGCTCCACGCCGCGCGGGTCTCGGTCGCCCGC 533 

Qy 2531 gcgcgcctggcgctggccgcggtggccgcggtggccttggccgtggcgctgctgccgctg 2590 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 534 GCGCGCCTGGCGCTGGCCGCGGTGGCCGCGGTGGCCTTGGCCGTGGCGCTGCTGCCGCTG 593 

Qy 2591 gcgcgcgtgggccgctatgagctgcagtacccgggcacgtggtgcttcatcggcctgggt 2 650 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 594 GCGCGCGTGGGCCGCTATGAGCTGCAGTACCCGGGCACGTGGTGCTTCATCGGCCTGGGT 653 

Qy 2651 cccccgggcggctggcgccaggcactgcttgctggcctcttcgccagcctcggcctggtc 2710 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 654 CCCCCGGGCGGCTGGCGCCAGGCACTGCTTGCTGGCCTCTTCGCCAGCCTCGGCCTGGTC 713 

Qy 2711 gcgctcctcgccgcgctggtgtgcaacacgctcagcggcctggccctgctacgcgcccgc 2770 

I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 714 GCGCTCCTCGCCGCGCTGGTGTGCAACACGCTCAGCGGCCTGGCCCTGCATCGCGCCCGC 773 

Qy 2771 tggcgacgccgctcccgacggcctcccccggcctcaggccccgacagccggcgtcgctgg 2830 

M I I M M I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 77 4 TGGCGACGCCGCTCCCGACGGCCTCCCCCGGCCTCAGGCCCCGACAGCCGGCGTCGCTGG 833 

Qy 2831 ggggcgcacggaccccgctcggcctccgcctcgtccgcctcgtccatcgcttcggcctcc 28 90 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M M I I I I I 
Db 834 GGGGCGCACGGACCCCGCTCGGCCTCCGCCTCGTCCGCCTCGTCCATCGCTTCGGCCTCC 893 

Qy 2 8 91 accttctttggcggctctcggagcagcggctcggcacgcagagctcgcgcccacgacgtg 2950 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
Db 8 94 ACCTTCTTTGGCGGCTCTCGGAGCAGCGGCTCGGCACGCAGAGCTCGCGCCCACGACGTG 953 

Qy 2951 gagatggtgggccagcttgtcggtatcatggtggtgtcgtgcatctgctggagcccaatg 3010 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 954 GAGATGGTGGGCCAGCTTGTCGGTATCATGGTGGTGTCGTGCATCTGCTGGAGCCCAATG 1013 

Qy 3011 ctggtgaggggcgcaccggcccctcgagccacgctccttcccgctccctctcggc 3065 

I I I I I I II M I I I I I III I I I I I I I I I I I 

Db 1014 CTGGTGTTGGTGGCGCTGGCCGTCGGCGGCTGGAGCTCTACCTCCCTGCAGCGGC 1068 
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AX280933 1209 bp DNA 

Sequence 556 from Patent WO0177172. 
AX280933 

AX28 0 933. 1 GI: 16608222 



linear PAT 02-NOV-2001 



human . 

Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (sites) 

Lehmann-Bruinsma, K. , Liaw.C.W. and Lin,I.L. 

Non-endogenous, consstitutively activated known g protein-coupled 
receptors 

Patent: WO 0177172-A 556 18-OCT-2001; 
Arena Pharmaceuticals, Inc. (US) 

Location/Qualifiers 

1. .1209 

/organism="Homo sapiens" 
/db_xref="taxon: 9606" 
107 a 469 c 424 g 209 t 



Query Match 24.1%; Score 944.4; DB 6; Length 1209; 

Best Local Similarity 96.9%; Pred. No. 3.6e-98; 

Matches 963; Conservative 0; Mismatches 31; Indels 0; Gaps 0; 

Qy 2072 atgagcccttgcgggcccctcaacctgagcctggcgggcgaggcgaccacatgcgcggcg 2131 
I I I I I I I I I I I I I I I I I I I I I I I M M M I I I I I I M M M M I I I M I I I I I I I I I I I I 

Db 1 ATGAGCCCTTGCGGGCCCCTCAACCTGAGCCTGGCGGGCGAGGCGACCACATGCGCGGCG 60 

Qy 2132 ccctgggtccccaacacgtcggccgtgccgccgtcgggcgcttcgcccgcgctgcccatc 2191 
I I I M I I I I I I I I I I I I I I I M M I I I I I I I I I M M M I I I I I I I I I I I I I I I I I M M 

Db 61 CCCTGGGTCCCCAACACGTCGGCCGTGCCGCCGTCGGGCGCTTCGCCCGCGCTGCCCATC 120 

Qy 2192 ttctccatgacgctgggcgccgtgtccaacctgctggcgctggcgctgctggcgcaggcc 2251 
I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I M M I M I M M I I I 

Db 121 TTCTCCATGACGCTGGGCGCCGTGTCCAACCTGCTGGCGCTGGCGCTGCTGGCGCAGGCC 180 

Qy 2252 gcgggccgcctgcgacgccgccgctcggccgccaccttcctgctgttcgtggccagcctg 2311 

I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I M I I M I I I I I I I I I I I I I I I I I I 
Db 181 GCGGGCCGCCTGCGACGCCGCCGCTCGGCCACCACCTTCCTGCTGTTCGTGGCCAGCCTG 240 

Qy 2312 ctggccaccgacctggcgggccacgtgatcccgggcgcgctggtgctgcgtctgtacact 2371 
I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I M M M M M M I I I I I I I I I I I 

Db 241 CTGGCCACCGACCTGGCGGGCCACGTGATCCCGGGCGCGCTGGTGCTGCGTCTGTACACT 300 

Qy 2372 gcggggcgcgctccggccggcggggcctgccacttcctgggcggctgcatggtcttcttc 2431 
I I I I I I I I I I M M M I I I I I I I I I I I I M I I I I I I I M I M M M M I I I I I I I I I I I I 

Db 301 GCGGGGCGCGCTCCGGCCGGCGGGGCCTGCCACTTCCTGGGCGGCTGCATGGTCTTCTTC 360 

Qy 2432 ggcctgtgcccgctgctgctgggctgtggcatggccgtggagcgctgcgtgggcgtcacg 2491 

I I I I I I I I I M I M I I I I I I I M M I I I I I I I I I I I I I I I I I I M M 

Db 361 GGCCTGTGCCCGCTGCTGCTGGGCTGTGGCATGGCCGTGGAGCGCTGCGTGGGCGTCACG 42 0 



Qy 2 4 92 cggccgctgctccacgccgcgcgggtctcggtcgcccgcgcgcgcctggcgctggccgcg 2551 
I I I I M I M I M I I M M M I I I I I I I I I I M M M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CGGCCGCTGCTCCACGCCGCGCGGGTCTCGGTCGCCCGCGCGCGCCTGGCGCTGGCCGCG 4 80 

Qy 2552 gtggccgcggtggccttggccgtggcgctgctgccgctggcgcgcgtgggccgctatgag 2611 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I M I I I 
Db 4 81 GTGGCCGCGGTGGCCTTGGCCGTGGCGCTGCTGCCGCTGGCGCGCGTGGGCCGCTATGAG 540 

Qy 2 612 ctgcagtacccgggcacgtggtgcttcatcggcctgggtcccccgggcggctggcgccag 2671 

I I I I I I I I I I M I M M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 541 CTGCAGTACCCGGGCACGTGGTGCTTCATCGGCCTGGGTCCCCCGGGCGGCTGGCGCCAG 600 

Qy 2672 gcactgcttgctggcctcttcgccagcctcggcctggtcgcgctcctcgccgcgctggtg 2731 

I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I M M I I I I I I I I I I I I I 
Db 601 GCACTGCTTGCTGGCCTCTTCGCCAGCCTCGGCCTGGTCGCGCTCCTCGCCGCGCTGGTG 660 

Qy 2732 tgcaacacgctcagcggcctggccctgctacgcgcccgctggcgacgccgctcccgacgg 27 91 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGCAACACGCTCAGCGGCCTGGCCCTGCATCGCGCCCGCTGGCGACGCCGCTCCCGACGG 720 

Qy 2792 cctcccccggcctcaggccccgacagccggcgtcgctggggggcgcacggaccccgctcg 2851 

I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 721 CCTCCCCCGGCCTCAGGCCCCGACAGCCGGCGTCGCTGGGGGGCGCACGGACCCCGCTCG 780 

Qy 2852 gcctccgcctcgtccgcctcgtccatcgcttcggcctccaccttctttggcggctctcgg 2911 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 781 GCCTCCGCCTCGTCCGCCTCGTCCATCGCTTCGGCCTCCACCTTCTTTGGCGGCTCTCGG 840 

Qy 2912 agcagcggctcggcacgcagagctcgcgcccacgacgtggagatggtgggccagcttgtc 2971 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M M I I I I I I I I I I I I I I I 
Db 841 AGCAGCGGCTCGGCACGCAGAGCTCGCGCCCACGACGTGGAGATGAAGGGCCAGCTTGTC 9 00 

Qy 2972 ggtatcatggtggtgtcgtgcatctgctggagcccaatgctggtgaggggcgcaccggcc 3031 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II II I I I I I 
Db 901 GGTATCATGGTGGTGTCGTGCATCTGCTGGAGCCCAATGCTGGTGTTGGTGGCGCTGGCC 960 

Qy 3032 cctcgagccacgctccttcccgctccctctcggc 3065 

III I I I I I I I I I I I 

Db 961 GTCGGCGGCTGGAGCTCTACCTCCCTGCAGCGGC 994 



